英特尔加入 GPU 战局,终用上 6nm 工艺?
The following article is from 老石谈芯 Author 老石谈芯的老石
作者 | 老石
来源 | 老石谈芯
头图 | CSDN 付费下载自东方 IC
在8月中旬结束的英特尔2020架构日活动里,英特尔发布了包括Tiger Lake SoC、Xe GPU、SuperFin晶体管工艺、FPGA路线图、oneAPI框架等一系列最新的技术进展。这些技术和产品涵盖了工艺、架构、存储、互连、安全、软件六大层面,这也是英特尔首席架构师Raja Koduri一直在主推的英特尔全栈式软硬件架构。
Xe GPU是英特尔近年来重点研发的下一代GPU架构。和英特尔之前的集成GPU不同,Xe更多的是一个基础GPU架构,由此可以衍生出多种针对不同应用领域和场景的GPU产品。这次正式发布的Xe GPU产品系列,从主打集成显卡和入门级独立显卡的XeLP,到针对游戏和桌面性能进行优化的Xe HPG,再到主要应用于数据中心和AI的Xe HP,然后还有面向高性能计算的Xe HPC,一共四大系列。
特别值得注意的是,这四类Xe GPU将使用不同的半导体制作工艺进行流片生产,其中不仅包含英特尔自家的10纳米工艺,以及这次发布的下一代10纳米SuperFin工艺,还包含了来自其他代工厂的工艺。虽然在发布会上没有直接点名,但台积电以6纳米工艺拿下英特尔数十万片芯片订单的消息,早就是公开的“秘密”了。
在今年的HotChips大会上,英特尔对Xe架构进行了深入介绍。可以看到,Xe GPU毫无疑问被英特尔寄予厚望。Xe的出现,正式宣布英特尔进军高性能GPU领域,也完成了英特尔的Scalar(CPU)、Vector(GPU)、Matrix(ASIC)、Spatial(FPGA)四大计算类型的芯片全覆盖。
在这篇文章中,我将从硬件架构、软件堆栈、应用场景等领域对Xe GPU进行深入的技术解析。我用思维导图的形式,总结了本文涉及的全部技术要点。
Xe架构的主要特点
在存储系统方面,XeLP重新设计了L1 Cache,并将L3 Cache的容量提升到了16MB。此外还将显卡内存的带宽增加了一倍。
XeLP的游戏性能
具体来说,XeLP里集成了多媒体引擎(Media Engine),它支持4K/8K60帧视频、Dolby视界HDR等一系列超高清视频标准,在编解码吞吐量上达到了最高2倍的性能提升。
在XeLP的显示引擎(Display Engine)里,集成了4条像素处理流水线,使得XeLP支持包括DisplayPort1.4、HDMI2.0、USB4 Type-C等多种视频接口,以及8K UHD、HDR10和杜比视界等多种超高清视频的播放。
关于多媒体引擎和显示引擎的具体架构细节,可以参见Xe在HotChips2020上的幻灯片,已上传至知识星球。
相比之前的集成显卡系列,Xe GPU对软件驱动的架构做了很多大刀阔斧的改变。其中最主要的有三点:更高效的编译器、全新的DirectX11驱动,以及GPU Profile(见下图)。此外,Xe还支持对特定游戏的针对性优化,名为Instant Game Tuning。这种优化方式会自动进行,不需要进行额外的驱动更新。
Xe GPU的产品系列和制造工艺
对于数据中心更广阔的应用场景,Xe有一款名为XeHP的GPU产品专门负责。和XeLP相比,XeHP在微架构上专门为数据中心做了优化,以提升GPU的整体性能。例如,XeHP的EU数量,从XeLP的几十个,直接增加到上千个;运行频率比XeLP上升两倍;显存带宽和IPC也比集成显卡提升10倍,等等。此外,XeHP还特别设计了数学运算单元,比如增强了对双精度浮点数和AI相关的数学运算的硬件支持。
更有意思的是,XeHP还能通过直接增加Tile的数量,实现性能的线性增长。例如,XeHP目前有三种封装形式,分别包含了1个、2个和4个Tile,其中每个Tile就是一个完整的Xe GPU子芯片。
Xe的第三个产品大类,名为XeHPG,它专门针对游戏和高性能桌面应用进行了优化,比如增加了光线追踪(Ray-Tracing)的硬件支持等等。XeHPG预计2021年正式出货。
Xe的最后一个产品系列,就是代号为Ponte Vecchio的XeHPC,它主要面向高性能计算、超级计算机等领域进行优化和设计。
前不久英特尔宣布,自家的7纳米工艺遇到问题,并将投产时间推迟到2022年,这也造成了英特尔股价暴跌近20%。随后英特尔宣布,会考虑和其他芯片代工厂合作,并外包部分芯片产品。正如本文开头提到的,台积电随后获得了英特尔的18万片6纳米芯片订单。
这些订单中的很大一部分,就来自Xe GPU系列。在本次发布会上,英特尔表示将会把XeHPG和HeHPC的一部分芯片使用“外部”工艺进行生产,如下图所示。相信这势必会加速Xe GPU的面世时间。
结语
更多精彩推荐
☞Mate40 成麒麟绝唱,光刻机进厂即遭抵押,北斗指路能否解除“芯痛”?
☞马斯克脑机接口、BrainOS相继发布,不努力也能有出路了
☞从 Dagger 到 Hilt,谷歌为何执着于让我们用依赖注入?
☞以太坊Layer 2 扩容,V神为什么偏爱ZK rollup ?